| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

174名北大學生能否考過AI?結果很意外


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
北京大學化學與分子工程學院,有機化學考試是許多同學痛並快樂著的挑戰。然而,期中考前突如其來的一條通知,卻讓這場考試的氣氛變得不同尋常:


“請注意,本次考試范圍不僅限於有機化學。”

但比起考試范圍的變化,考場裡迎來的一批“特殊考生”,更讓人意想不到。


它們不需要落座,也無需紙筆。它們是GPT、Gemini、DeepSeek……這些當下世界上最聰明的AI,正在雲端與174位北大化學與分子工程學院的大二學生同場競技。

這是一場精心設計的“圖靈測試”,也是北大科研團隊為大語言模型投下的一塊“試金石”。

近日,北京大學化學與分子工程學院聯合北大計算中心、計算機學院、元培學院團隊,發布了最新成果SUPERChem。近期,他們以一套“北大試卷”為標尺,冷靜丈量著AI在科學推理上的真實邊界。



一場特殊的期中考

打開SUPERChem的題庫,一種“壓迫感”撲面而來。

晶體結構的精細解析、反應機理的深度推演、物化性質的定量計算……這500道題目並非來自網絡上隨手可得的公開題庫,而是源於對高難度試題和前沿專業文獻的深度改編。


為什麼要費盡周折重新出題?

“因為大模型太會‘背書’了。”團隊成員解釋道。互聯網可及的測試題大多已被博聞強識的AI在訓練階段熟讀。而化學,恰恰是一門不能只靠死記硬背的學科。它既有嚴密的邏輯推演,又充滿了對微觀世界的空間想象。“我們非常好奇,大語言模型的一維next token prediction,能否解決二維、甚至三維空間中的復雜推理問題。”

要設計一套讓AI“沒見過”、必須靠硬實力推理的題目,難度極高。然而,這正是北大化院的獨特優勢所在。近百名師生——其中不乏奧賽金牌得主——集結起來,決定給AI出一套高門檻、重推理、防作弊的試卷。


他們要考的,是AI是否真的“懂”化學。

一場游戲中的學術共創

設計題目往往是枯燥的,但這群年輕的北大人卻把它變成了一場“游戲”。

為了構建這套高質量評估集,團隊搭建了一個專屬協作平台。在這裡,出題、審題、修題從單調的任務,變成了一套循序漸進的“通關”流程。成員們在平台上協作,互相審閱、彼此“找茬”,讓嚴謹的科學探討與活躍的思維碰撞交織共融。

團隊還引入了積分激勵系統,讓出題過程就像在游戲中打怪升級。一道題目需歷經編寫初稿、撰寫解析,再通過初審與終審的嚴格審核,每個環節均由不同的同學把關,並發放相應的積分。終審通過的題目,甚至最多迭代過15個版本。


不錯的新聞,我要點贊     這條新聞還沒有人評論喔,等著您的高見呢
上一頁123下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0188 秒 and 5 DB Queries in 0.0014 秒